Informationsextraktion durch Verwendung Computerlinguistischer Verfahren in Texten mit Makrostruktur
نویسندگان
چکیده
In diesem Beitrag wird ein System vorgestellt, mit dem semistrukturierte militärische Aufklärungsmeldungen analysiert werden können, um ontologiegestützt ein automatisches Szenenmodell aufzustellen. Im Rahmen der hier vorgestellten Studie wurde untersucht, in wie weit dazu das Open Source Natural Language Processing-Framework GATE eingesetzt werden kann. Ein GATE-basierter Prototyp wurde mit J2EE als Web-Service bereitgestellt und mit einer web-basierte Oberfläche zur Interaktion mit dem System und zur Visualisierung extrahierter Modelle versehen.
منابع مشابه
Korpuslinguistik - zu wissenschaftstheoretischer Grundlagen und methodologischen Perspektiven
Im Zusammenhang mit den folgenden Überlegungen steht der Terminus Korpuslinguistik für die Gesamtheit aller Tätigkeiten, die darauf gerichtet sind, (1) umfangreiches authentisches Sprachoder Textmaterial (gesprochen oder geschrieben) zu sammeln, zusammen zu stellen, aufzubereiten, mit Informationen zu annotieren, zu verwalten und zu warten sowie verfügbar zu machen, (2) solches Material für wis...
متن کاملInteraktive Wissensextraktion und Wissenssuche
Die hochwertige Annotation von Entitäten und ihren Beziehungen ist ein Schlüssel zur Erschließung großer Textmengen, erfordert aber eine Kombination von effizienten maschinellen Verfahren und manueller Überprüfung. Darüber hinaus ist auch eine ausdrucksstarke Suche, die über eine reine Schlüsselwortsuche hinausgeht, von entscheidender Bedeutung. Dieser Artikel stellt die Knowledge Workbench vor...
متن کاملWissen gewinnen durch Wissen: Ontologiebasierte Informationsextraktion
Die Aufgabe der Informationsextraktion (IE) ist es, aus Texten einer Domäne gezielt die Informationen zu entnehmen, die gerade interessieren, und alle anderen zu überlesen (mehr z.B. bei Neumann 2004). Diese Aufgabe hat offensichtlich etwas mit der Fragebeantwortung (Question Answering) und mit dem themenoder fragespezifischen Zusammenfassen (Hintergrund dazu bei Afantenos et al. 2005, Endres-N...
متن کاملSpektral modellierbare Lichtquelle zur Erzeugung beliebiger Spektren durch Einsatz eines "Digital Mirror Device"
Zusammenfassung. Die mehrkanalige bzw. multispektrale Bildgewinnung gewinnt zunehmend ein größeres Interesse vor allem in Bezug auf die spektrale Repräsentation der zu erfassenden Objekte. Die Kenntnis der spektralen Eigenschaften ermöglicht eine differenzierte farborientierte Verarbeitung der erzeugten Bilder. Neben der spektralen Erfassung von Vorlagen, die heute durch den Einsatz mehrkanalig...
متن کاملErkennung von Schreibern mittels handgeschriebener Buchstaben
Das Forschungsprojekt „Herbar Digital” [JKS00] startete 2007 mit dem Ziel der Digitalisierung des Bestands von mehr als 3,5 Millionen getrockneter Pflanzen bzw. Pflanzenteile auf Papierbögen (Herbarbelege) des Botanischen Museums Berlin. Da gelegentlich der Sammler der Pflanze unbekannt ist, wurde in der vorliegenden Arbeit ein Verfahren entwickelt, um aus kursiv geschriebenen Buchstaben deren ...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2007